当前,冷存储系统设计和应用一发不可收拾得益于其优势,当然事物都存在两面性,有长处也有短处,目前数据冷存储存在三大问题:
一、处理器/硬盘的比率。给定处理器比率越低则系统成本越低。然而,其副作用是一旦处理器失效,会有更多的数据不可访问。系统设计者需要权衡,并采用软件手段减少处理器失效后的不良后果。
二、功耗控制。系统的软硬件节能方案可能会增加硬件成本,并增大数据访问的延迟。系统设计者需要在CAPEX、OPEX和SLA之间进行取舍。
三、数据块编码方式。选用适当的纠删码,可以对硬盘数据利用率、数据可用性及数据重构时间等多个目标进行有效的优化。
统计显示,热数据、温数据和冷数据占总数据量的比例约为5%、15%、80%。当前,各类数据的存储和访问策略正在迅速分化,数据分层趋势加剧。一般情况下,热数据被放到内存或者SSD中,而冷数据被放入低转速HDD,甚至硬盘被置于长期下电状态,也有业界厂商考虑将蓝光用于冷数据。
白皮书认为,今天冷数据的应用特征正在越来越清晰。一、数据的访问频率很低,但是用户仍想保留这些数据;二、相应时间要求随着应用需求的减少而逐渐降低;三、单位数据量要求的系统宽带低;四、数据量巨大;五、对于特定的数据需要备份、存档等。
值得一提的是,大数据技术的应用正在推动冷存储的发展。白皮书指出,不同行业应用场景对于冷存储的要求不尽相同。现在企业正逐步加大对大数据的投资,来识别用户和运营趋势,从而获得重要业务洞察能力。随着大数据的快速发展,可以支持公司通过分析来自不同地方的大量信息,获得重要见解。大数据的分析也可以运用到多个冷存储使用情形中,比如:在备份中,如果信息被保存于本地而非场外,典型的备份工具则无法区分这些信息,通过大数据分析可以筛选出大量数据,以确定哪一项目发生了变化,因而需要备份,这有助于节约时间,同时减少处理容量和带宽。
专业的冷数据近离线存储欢迎致电成都吉福汇,全国服务热线:400-028-4366/028-85538251